权威指南一定是对的?——针对「锂盐治疗双相抑郁」的深度分析 | 文献述评
医脉通导读
基于现有证据,目前尚不足以推荐将锂盐作为双相障碍抑郁发作的一线药物,FDA也未批准锂盐治疗双相抑郁。
然而,本项综述回顾的16部主流指南中,有多达10部将锂盐推荐为双相抑郁的一线药物。分析显示,这些指南所参考的研究证据存在诸多疑点和缺陷,而Woozle效应、过度引申、信念固着三个「无心之过」可能在其中扮演了重要的角色。
上述现象并无欺骗的主观意图,但常呈现出惯性,客观上很容易对临床造成误导,可能反映了同行评审过程中的问题。无论研究作者还是期刊,均需抵御这些风险,让循证学医疗实践更「循证」。
锂盐是双相躁狂及维持期治疗的一线用药,其抗自杀效应也得到了广泛的认可。针对双相抑郁,锂盐虽然是研究证据最多的治疗手段,但疗效尚存争议,美国食品药品监督管理局(FDA)也未批准锂盐治疗双相抑郁。
然而,美国乔治华盛顿大学Tammas Kelly博士检索了全球范围内的16部双相障碍临床指南,发现其中10部指南将锂盐推荐为双相抑郁的一线药物,1部指南推荐为二线药物,5部指南的推荐等级在三线或以下。这一现象不同寻常。Kelly博士认为,以下三个「无心之过」可能扮演了重要的角色:
1. Woozle效应(Woozle effect)
指缺乏证据或无定论的原始文献被反复引用,并在这一过程中不断被强化,导致后人误认为证据确凿或已成定论。例如,原始文献中的「可能」在引用过程中不知不觉地变成了「一定」。
2. 过度引申(reference inflation)
常与Woozle效应伴随出现,指引用某篇原始文献后,由于进行了主观演绎,所得到的结论并没有真实地反映原始文献的结果。这一概念应与「引文注水」(citation inflation)相区分,后者是期刊提高自身影响因子的惯用手段。
3. 信念固着(belief perseverance)
指固守某些旧观念或旧证据,即便出现了与之冲突的新证据也不为所动,或采取忽略或苛责的态度。一旦牵扯到既往临床经验,这种现象尤其容易构成问题。
Kelly博士对这些指南给出推荐等级的依据进行了追溯回顾,并得到了一系列发现。该研究于2月9日在线发表于Bipolar Disord.。
真实证据
有6项指南之所以推荐将锂盐作为双相抑郁的一线药物,1993年Zornberg及Pope的综述,以及1995年Srisurapant的综述,在其中发挥了关键的作用。这两项综述所纳入的9项研究完全相同,均为针对双相障碍住院患者的交叉研究:患者首先使用安慰剂治疗5-21天,随后接受锂盐治疗。
问题在于,这两项综述均存在大量的过度引申现象。Zornberg综述中指出,9项研究中有7项显示锂盐的疗效在统计学上显著优于安慰剂。Srisurapant综述在此基础上指出,第8项研究同样显示锂盐显著优于安慰剂。然而事实上,只有1项研究真正在统计学层面比较了锂盐与安慰剂的疗效,结果显示锂盐并不显著优于安慰剂。8项研究中,锂盐疗效并非主要转归指标。两项综述均自行对结果进行了演绎解读,且并未报告相关P值。
那么,这9项研究实际上是怎样的?以下按文献发表的先后顺序列举几例:
▲ 1968年,Fieve等比较了丙米嗪与锂盐治疗双相抑郁的疗效。研究者指出,锂盐组受试者的病情平均改善了32%,但并未报告病情改善的患者比例,导致无法进行统计学分析。尽管如此,两项综述仍将该研究视为「有统计学显著性意义」的研究。
▲ 1969年,Goodwin等在研究中指出,双相抑郁患者在使用锂盐治疗后有23%「明确完全有效」,31%「明确部分有效」,15%病情恶化。作者在分析本项研究及过去有关锂盐的研究时明确写道:「当前,碳酸锂并没有被视为抗抑郁药的倾向。」本项研究也被两项综述视为「有统计学显著性意义」的研究。
▲ 1970年,Greenspan等分析了3名双相抑郁患者的儿茶酚胺代谢情况。研究者称,3名患者的病情在治疗后均有改善,但未针对锂盐的疗效进行统计学分析。事实上,仅仅基于3名受试者的数据,也无法进行可靠的数据分析。Zornberg准确地报告了上述发现,但Srisurapant则在综述中写道:「锂盐优于安慰剂。」
……
两篇综述的作者也有准确报告研究的情况。例如,针对1971年Stokes等发表于《柳叶刀》的研究,两篇综述均指出,锂盐针对双相抑郁的疗效并不显著优于安慰剂。然而,两篇综述的总体结论均有待商榷。例如,Srisurapant指出锂盐的治疗收益「令人印象深刻」(impressive),Zornberg则指出「针对双相抑郁,锂盐的疗效大大(markedly)优于安慰剂。」两组作者注意到并指出了所纳入研究的部分局限性,但仍遗漏了诸多问题。
总体而言,无论是Zornberg的综述还是Srisurapant的综述,都不能被视为对文献的荟萃分析,存在大量的过度引申。关键是,他们的综述在很大程度上「带跑」了很多指南。
CANMAT/ISBD指南
作为具有全球影响力的双相障碍权威指南,加拿大CANMAT/ISBD指南也推荐锂盐作为双相抑郁的一线药物。鉴于该指南对证据进行了值得赞赏的开放性的讨论,本文博士针对该指南及其所引用的证据进行了深入分析。以下简要介绍。
(横屏查看)
表1 2018年CANMAT指南双相抑郁急性期治疗推荐
加拿大/ISBD指南推荐锂盐作为双相 I 型和 II 型相关抑郁发作的一线药物,证据等级为2级。该指南明确规定:「一线推荐」要求「1级或2级疗效证据+安全性/耐受性临床支持+无治疗过程中的心境转相」,「2级证据」要求「结果置信区间宽的meta分析或一项随机双盲安慰剂/活性对照研究证据,后者每个活性治疗组样本量≥30」。
然而,事实又是如何?
针对双相 I 型抑郁,加拿大/ISBD指南的推荐基于上文介绍的Srisurapant综述,尽管该综述既非meta分析也非随机双盲对照研究,且存在大量的过度引申。
另一个疗效证据为STEP-BD研究,但该研究实际上明确指出:「治疗双相抑郁急性发作时,单用包括锂盐在内的心境稳定剂与联用抗抑郁药时同样有效,但长期康复率较低,且没有专门比较锂盐与其他抗躁狂药物的亚组分析。」事实上,该研究不仅没有专门针对锂盐的分析,锂盐组受试者数量小于30,其本身也不是一项随机双盲安慰剂对照研究,此处同样属于过度引申。
双相 I 型抑郁方面的证据同样存在诸多疑点,导致其达不到「2级证据」的标准,进而不符合「一线推荐」的要求。例如,该推荐在很大程度上基于一项为期16周的随机双盲对照研究结果,但该研究针对「有效」的定义(任意连续2周抑郁症状较基线减轻50%)值得商榷,且锂盐组只有22名受试者完成研究。
指南还引用了4项小规模「安慰剂对照研究」,但这些研究不仅受潜在Woozle效应的影响,有「以讹传讹」之嫌,还存在至少7处过度引申。另一项比较锂盐与拉莫三嗪的研究中,锂盐组只有39%的受试者完成了研究,共19人,也不满足「最低30人」的要求。
除了过度引申、「通融」阳性证据外,加拿大/ISBD指南还存在信念固着的现象,表现为对阴性证据的忽略及消极处理,包括一项1级阴性证据及一项2级阴性证据,在此不详述。
「清流」
以下五部指南中,锂盐治疗双相抑郁的推荐等级较低,或不推荐使用:
▲ 国际神经精神药理学会(ICNP)指南中,锂盐被列为双相抑郁的四线药物,定义为「随机对照研究数据无定论或质量低」。
▲ 世界生物精神病学会联合会(WFSBP)指南直接引用了上文中Zornberg的综述,基于「不一致的结果」,将锂盐列为双相抑郁急性发作的五线药物。
▲ 德克萨斯药物治疗流程(TMAP)不推荐锂盐单药治疗双相抑郁,称只有「开放标签研究、病例系列及专家临床共识」形式的「有限数据」。
▲ 英国国家卫生与临床优化研究所(NICE)指南不推荐锂盐治疗双相抑郁,「原因是缺乏足够的检验」。
▲ 英国精神药理学会(BAP)指南不推荐锂盐治疗双相抑郁,原因是「针对双相抑郁的急性疗效证据不佳」。
结语
本项综述显示,基于现有证据,目前尚不足以推荐将锂盐作为双相抑郁的一线治疗药物,这一点与当前相当一部分主流指南的推荐存在冲突。
指南编写者均为该领域内的权威专家,在撰写指南的过程中花费了大量的时间和精力,其奉献无疑值得赞赏。然而,Woozle效应、过度引申及信念固着对指南的影响不容小觑。这些现象主观上并无欺骗的意图,但常呈现出惯性,客观上很容易造成误导,可能反映出同行评审过程中的问题。无论研究作者还是期刊,均需要抵御这些风险,让循证学医疗实践更「循证」。
文献索引:Kelly T. Lithium and the Woozle effect. Bipolar Disord. 2019 Feb 9. doi: 10.1111/bdi.12753. [Epub ahead of print]